你的浏览器版本过低,可能导致网站不能正常访问!为了您能正常使用网站功能,请使用这些浏览器。
chrome
Firefox

工具栏

特斯拉引领自动驾驶大模型时代

人工智能?

特斯拉FSD落地中国进入倒计时


2024 年 3 月 16 日,特斯拉开始向美国 FSD 用户推送 FSD Beta V12.3 版本高阶辅助驾驶系统,这一举措标志着自动驾驶技术的重要里程碑。此前,更有消息爆料 FSD 能熟练地将患者送至医院。

FSD,Full Self-Drive即完全自动驾驶,它基于先进的技术架构,包括 BEV/占用网络+Transformer 的端到端神经网络 AI 系统。这一大模型融合了感知、预测和决策规划等多个关键环节,算法由规则驱动转向数据驱动,将人类的驾驶习惯通过训练学习融入神经网络的参数之中,达成类似人类驾驶决策和响应水平,相较于基于规则的模型,具备更强大的泛化能力。规则判断取决于规则数量的多寡与合理性,存在诸多 corner case。

同时数据驱动使算法得以大幅简化,据说 V12 仅有约 3000 行代码,而 V11 则多达 30 多万行。

目前特斯拉已在中国设立数据中心,FSD 或将在 2025 年落地中国,加快中国电动汽车智能化进程。


那么,何为端到端?

即直接从视觉信息输出控制指令。


何为BEV?

BEV,全称 Bird's eye view,即鸟瞰视角。它将三维环境信息投射到二维,以俯视角展现环境和目标物。这种视角提供了全局视野,消除了数据遮挡,大大提高了感知能力。不仅如此,纯视觉方案中也存在 BEV,因为有多个摄像头的支持。


何为占用网络?

占用网络,作为 3D 化的 BEV,通过算法进行空间占用的检测。它不需要明确障碍物的具体身份,只需知道其占用了前行空间,就能规划出合适的行驶路径。


何为Transformer?

Transformer,也就是当下大家所熟知的主流“大模型”。它具有多头注意力机制,在处理长序列数据和复杂的上下文关系时具有独特优势。它能够挖掘序列中不同元素的联系,实现全局理解,提高感知能力和泛化能力。

然而,传统的 2D+CNN/RNN 模型在处理长序列数据时存在着较大的局限性,感知能力差,参数少、层级少,泛化能力差,无法满足高阶自动驾驶海量数据处理的需求。

  • Transformer可实现对 BEV 数据的特征提取,达成对目标物的感知;
  • 能够捕捉目标物的运动模式与历史轨迹数据,预测目标物的行为与轨迹;
  • 将环境、目标物、车辆数据整合至模型中,可平衡不同信息的权重,直接做出合理的规划决策。

当然,Transformer 大模型计算层级多,参数量大,算力需求也更大。 目前,新势力、BYD华为、地平线等车企与零部件公司纷纷布局大模型,BEV/占用网络+Transformer 已成为主流。


未来趋势

算法的迭代将降低对地图甚至激光雷达的依赖,同时算法的开发与训练成本也将上升。端到端的占用网络+transformer 大模型计算量巨大,对芯片的算力提出了更高要求,将推动芯片技术的不断进步。


反思

个别老牌从业公司硬件配置与算法落后,感知能力低下,基于规则的决策规划造就了众多的 corner case。

好在目前自动驾驶仍处于 L2+级别,凭借友商“激进”的高阶策略,和自身产品成熟、成本控制相对较好的优势,这些公司仍占有不小的市场份额。然而,留给他们的时间已然不多。

内容由作者提供,不代表易车立场

收藏

收藏成功 ! 去易车app查看收藏文章

猜你想看

+加载更多

活动推荐

广告
  • 奖 
  • 抢 
  • 奖 

相关车型

CopyRight © 2000-2023 BitAuto,All Rights Reserved. 版权所有 北京易车信息科技有限公司    购车咨询:4000-168-168 (周一至周日 9:00 – 21:00) 法定假日除外